VASO: Habilidades auto-evolutivas verificables para agentes de IA física
VASO logra un 97.2% de cumplimiento de especificaciones temporales con menos de 100 muestras en habilidades robóticas auto-evolutivas.
VASO logra un 97.2% de cumplimiento de especificaciones temporales con menos de 100 muestras en habilidades robóticas auto-evolutivas.
Descubre cómo VASO revoluciona las habilidades robóticas: verificación formal guía su evolución, logrando un 97.2% de cumplimiento con menos de 100 muestras.
La semántica formal revela equivalencias y brechas entre SGD y MCP. Cinco principios para protocolos de agentes seguros y verificables.
Descubre la demostración formal de bisimilitud entre SGD y MCP y los 5 principios para protocolos seguros.
Descubre cómo el proyecto VeriFIRE verifica propiedades de consistencia en un sistema de detección de incendios con redes neuronales, logrando soluciones rápida
Nuevo método adaptativo certifica redes neuronales para dinámicas no lineales con cotas de error formales, superando al estado del arte. Ideal para sistemas críticos.
Automatiza la búsqueda de demostraciones en Isabelle/HOL con el Abduction Prover, que identifica conjeturas útiles mediante razonamiento abductivo. Acelera tu verificación formal.
Descubre cómo el algoritmo LG-ND optimiza el ancho neuronal para proxies ACOPF, reduciendo neuronas hasta 10 veces y garantizando verificación formal en sistemas críticos.
Un algoritmo incremental (LG-ND) determina el ancho neuronal mínimo para proxies de ACOPF, logrando rendimiento equivalente con hasta 10x menos neuronas. Ideal para seguridad en redes eléctricas.
Descubre cómo un marco de IA resuelve problemas matemáticos complejos combinando razonamiento informal y verificación formal en Lean 4, todo sin intervención humana.
EVA: nueva técnica de alineación de valor esperado que permite recompensas continuas en verificación formal de matemáticas con Lean 4. Mejora la evaluación de pasos intermedios.
Descubre Hermes: agente que combina razonamiento informal y verificación formal en Lean para mejorar precisión matemática en LLMs un 40% con 80% menos coste.
Aprendizaje por refuerzo e inferencia recursiva automatizan verificación formal. Logros: del 2% al 58% en Dafny y mejoras en Lean.
Descubre cómo las funciones de valor en RL sirven como certificados de supermartingala para garantizar propiedades en sistemas estocásticos. ¡Una conexión teórica revolucionaria!